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(57) Abstract: The invention relates to enzymes from the specific groups of calpain proteases, which take part in a plurality of 
metabolic processes, e.g. by acting on the apoptosis, for certain cancerous diseases and during cell migration. The invention also 
relates to enzymes from the group of metal loproteases which develop, e.g. activities during fertilisation, and take part in blood 
pressure regulation as ACEs and as collagenases in collagen metabolism. A potential need of such enzymes is mainly covered today 
by plant and animal sources. Known organisms in which such proteases naturally occur exclusively come from warmer regions, such 
that a costly heat supply necessitating complex apparatus is required during the production thereof. Organisms comprising enzymes 
adapted to the cold are known however. The invention thus also relates to nucleic acid sequences coding for a calpain 7 protease 
and a zinc metalloprotease, which originate from the marine diatoms Fragilariopsis cylindrus adapted to the cold and correspond to 
SEQ ID No.l, SEQ ID No.2 or functional variants or fragments having at least 8 nucleotides thereof. 

[Fortsetzung auf der ndchsten Seite] 
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(57) Zusammenfassung: Enzyme aus der spezifischen Gruppe der Calpain-Proteasen sind an vielen Stoffwechselvorgangen be- 
teiligt, z.B. durch Einflussnahme auf die Apoptose, bei bestimmten Krebserkrankungen und bei der Zell-Migration. Enzyme aus 
der Gruppe der Metalloproteasen entwickeln z.B. Aktivitaten bei der Befruchtung, sind als ACE bei der Blutdruckregulierung und 
als Collagenasen bem Collagen Stoffwechsel beteiligt. Ein etwaiger Bedarf an solchen Enzymen muss heute hauptsachlich aus 
pflanzlichen und tierischen Quellen gedeckt werden. Bekannte Organismen, in denen solche Proteasen natiirlicherweise vorkom- 
men, stammen ausschlieBlich aus warmeren Regionen, sodass bei ihrer Produktion eine okonomisch und apparatetechnisch aufwan- 
dige Warmezufuhr erforderlich ist. Bekannt sind jedoch auch Organismen, die kalteangepasste Enzyme aufweisen. Die Erfindung 
beansprucht daher fur eine Calpain-7-Protease und eine Zink-Metalloprotease kodierende Nukleinsauresequenzen, die aus der kal- 
teangepassten marinen Diatomee Fragilariopsis cylindrus stammen und gemaB SEQ ID No.l, SEQ ID No.2 oder als funktionelle 
Varianten oder als Abschnitte mit mindestens 8 Nukleotiden davon ausgebildet sind. 
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Fur proteinspaltende Enzyme in Form von spezifischen Proteasen 
kodierende Nukleinsauresequenzen, zugehorige Polypeptide und 
Verwendung von alien. 

5 Beschreibung 

Die Erfindung bezieht sich auf fQr proteinspaltende Enzyme in Form von 
speziellen Proteasen kodierende Nukleinsauresequenzen, auf die zugehorigen 
Polypeptide und auf Verwendungen sowohl der Nukleinsauresequenzen selbst 
als auch der zugehorigen Polypeptide. 

Proteasen (auch: Proteinasen) sind eiweiSspaltende Enzyme ( M proteolytische 
Hydrolasen") die nach ihren Wirkungsmechanismen unterschieden werden. 
EiweiSe sind typisch gefaltete Polypeptidketten. Die Proteasen werden daher 
auch als Peptidasen bezeichnet und in Endo- und Exopeptidasen 
unterschieden. Endopeptidasen spalten die Peptidketten im Inneren auf und 
erzeugen so kleinere Teilstiicke, Exopeptidasen konnen die endstandigen 
Aminosauren abspalten. Proteolytisch wirkende Enzyme sind in biologischen 
Organismen allgegenwartig und erfullen typspezifische Zwecke. Sie konnen 
daher einerseits funktionsbezogen zu Therapiezwecken eingesetzt werden oder 
technischen Reinigungszwecken gegen proteinhaltige Verschmutzungen 
dienen. Die Familien der Calpain-Proteasen (CANP) und Metalloproteasen 
(MP) sind wichtige Vertreter der Proteasen und Gegenstand intensiver 
Forschungen. 

Calpain-7-Protease: 

Bisher sind ca. 15 verschiedene CANP bekannt. Die am weitesten erforschten 
CAPN bestehen aus einer grolien 80kDa (kilo Dalton) - und einer kleinen 
30kDa - Untereinheit. Die groSe Untereinheit besteht ihrerseits aus vier und 
die kleine Untereinheit aus zwei funktionalen Domanen. Die Domane IV der 
grolSen und die Domane VI der kleinen Untereinheit sind regelma&ig Qber ihre 
Faltungsformen („EF-hands u ) als calziumbindende Domane ausgepragt. Es 
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wird vermutet, dass die proteolytische Aktivitat dieser CAPN erst durch die 
gebundenen Calziumatome ausgelost wird. Die neueren CAPN (5,6,7,10,13; 
vergleiche z.B. Veroffentlichung I) verfQgen dagegen in der Domane IV der 
groBen Untereinheit uber keine solchen, calziumbindenden Strukturen. 
5 Grundsatzlich sind alle Mitglieder der CAPN-Familie gewebsspezifisch 
ausgebildet und erfiillen so die unterschiedlichsten Aufgaben. 

CAPN nehmen oft Schlusselstellungen in Stoffwechselwegen ein und sind am 
Verlauf von Krankheiten beteiligt. Z.B. sind die CAPN 1 und 2 Komponenten 

10 der Reaktionskaskade der Apoptose („programmierter Zelltod") und damit am 
Verlauf der Alzheimer-Krankheit beteiligt. Auch auf Krebserkrankungen k6nnen 
CAPN Einfluss nehmen. Dabei werden z.B. Brust- und Darmkrebs durch die 
Erhohung der zellularen Konzentration des p53-Markerproteins ausgelost. Der 
Konzentrationsanstieg wird durch die Inhibierung von beteiligten CAPN erreicht, 

15 die die p53-Konzentration in gesunden Zellen normalerweise sehr gering halten 
(vergleiche Veroffentlichung I: „The calpain family and human disease", 
Yuanhui Huang und Kevin K.W.Wang in Trends in Molecular Medicine Vol.7 
No.8 August 2001 , pp 355-362). 

20 Calpaine spielen eine besondere Rolle bei der Zell-Migration in der 
extrazellularen Matrix. Zellen wandern, indem sie sich am hinteren Ende 
auflosen und am vorderen Ende aufgebaut werden. Calpaine sind dabei durch 
proteolytische Spaltung von Proteinkomplexen des Stutzapparats am Ende der 
Zelle an dieser Wanderungsbewegung beteiligt (vergleiche Veroffentlichung II: 

25 „V-SRC's hold over actin and cell adhesions", Frame, Fincham, Carragher, 
Eyke in Nature Reviews, Molecular Cell Biology, Vol.3, April 2002,pp 233-245). 

Die beschriebenen Erkenntnisse wurden durch Untersuchungen an 
Wirbellosen, Saugetieren und dem Menschen gewonnen. CAPN in Pflanzen 
30 und Pilzen sind bisher nur durch Genom- und EST-Projekte identifiziert worden. 
Bei Pflanzen wird eine Wirkung in der Pathogenabwehr, bei Pilzen bei der 
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Anpassung an alkalische Lebensbedingungen vermutet. Bei der gesamten 
Klasse der Kieselalgen sind CAPN bisher nicht bekannt. 

Enzyme aus der Familie der Calpaine (jedoch nicht Calpain-7) werden in der 
5 Patentliteratur z.B. in EP1214427, CA2321270 und DE10031932 offenbart. In 
Bezug auf die vorliegende Erfindung handelt es sich bei diesen 
Veroffentlichungen um technisch-wissenschaftlichen Hintergrund. 

Zink-Metalloprotease: 

Metalloproteasen (MP) sind unter anderem regelmafcig in den Mitgliedern der 
sogenannten ADAM-Familie (a disintegrin and metalloprotease) der 
Transmembran-Proteine enthalten, die aus einer Desintegrin- und einer MP- 
Domane bestehen und Zelladhasions- und Proteaseaktivitat im 
Zusammenhang mit Vorgangen bei der Befruchtung, der Entstehung von 
Nervengewebe und bei EntzQndungsreaktionen entfalten (vergleiche 
Veroffentlichung III: „Autotrope Signaltransduktion durch membranstandigen 
Tumor-Nekrose-Faktor TNF", Doktorarbeit Uni Stuttgart, E.Haas, 1999, pp 6-8). 

Ferner spielen Metalloproteasen eine wichtige Rolle im Renin-Angiotensin- 
Aldosteron-System (RAS). Die Aspartyl-Protease Renin spaltet 
Angiotensinogen in Angiotensin I. Das Angiotensin-Converting-Enzym (ACE), 
das anschlieliend Angiotensin I in Angiotensin II spaltet, ist eine Zink- 
Metalloprotease (ZnMP). Angiotensin II hat eine gefaBverengende und damit 
Blutdruck steigernde Wirkung und fordert die Freisetzung von Aldosteron in der 
Nebennierenrinde woraus letzlich Hypertrophie am Herzen folgt. ACE ist also 
ein wichtiger Stoff zur Regulierung der Kreislauffunktionen und muss bei 
bestimmten Herz-Kreislauferkrankungen unterdrtlckt werden (ACE-lnhibitor) 
(vergleiche Veroffentlichung IV: Cardiovascular Physiology Concepts, 
University of Ohio, R.E.KIabunde,v.04.06.2002 aus htto:/ /www. oucom.ohiou.edu/ 
CVPhvsioloav/BP015.htm (Stand 20.08.2002)). 
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Weiterhin sind Metal loproteasen als Collagenasen am Abbau von Stutzgewebe 
im Korper beteiligt. Collagene sind GerOsteiweifJkorper und bilden als gegen 
enzymatische Angriffe schutzender Hauptbestandteil interzellularer 
Stutzsubstanz 25% des Korpergewebes. Durch Einlagerung mineralischer 
Kristalle konnen Collagene zu harten Knochen- und Zahnsubstanzen werden. 
Im Collagen-Lebenszyklus dienen Collagenasen zur Verarbeitung nicht mehr 
benotigter Collagenanteile. Collagenasen spielen eine Rolle bei der 
Chemonukleolyse, einer Behandlungsmethode bei Bandscheibenschaden 
durch Auflosung des Bandscheibenkerns (nucleus pulposus). 

Enzyme aus der Familie der Metalloproteasen werden in der Patentliteratur z.B. 
in W0996461 0 (Zink-Metalloprotease), US2002068055 (Metallo- 
Endopeptidase) und US5750391 (Metallo-Endopeptidase) offenbart. In Bezug 
auf die vorliegende Erfindung handelt es sich bei diesen Veroffentlichungen 
auch um technisch-wissenschaftlichen Hintergrund. 

Aus der Veroffentlichung V „Zahllose Geheimnisse der Natur" von K. Eske 
(vgl. BioLOG, 3.Ausgabe, Februar 2000, pp 2/3, abrufbar unter 
http ://www. bioreg io . o rg/B ioLOG-3 . pdf . - GrolWKIeinschreibung bei Seitenaufruf 
im Internet beachten! - Stand 01.09.2002) ist es bekannt, kalteangepasste 
Enzyme aus Bakterien, die in Tiefseeregionen vorkommen, zu isolieren. Neben 
dem Vorteil, dass kalteangepasste Enzyme zur Expression keine erhohten 
Temperaturen benotigen, ergibt sich bei den entsprechenden Organismen aus 
den Tiefseeregionen ein groSes Vorkommenspotential, da 80% des die 
Erdoberflache bedeckenden Wassers eine Temperatur unter 5 °C aufweist. Die 
Temperatur des Aktivitatsmaximums dieser Organismen und ihrer funktionellen 
Bestandteile liegt deutlich unter dem anderer Organismen aus temperierten 
und tropischen Breiten. Durch den Einsatz von kalteangepassten 
Mikroorganismen, auch in gentechnisch modifizierter Form, ist damit eine 
Produktion unter niedrigen Temperaturen mit einem gegenliber den 
herkommlichen Gewinnungsverfahren mit nicht kalteangepassten Organismen 
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deutlich geringerem Energieeinsatz entscheidend wirtschaftlicher als bei deren 
sonst ublichen Aktivitatstemperaturen. 

Vor dem Hintergrund dieser bedeutenden Erkenntnisse ist es daher die 
5 Aufgabe fur die vorliegende Erfindung, zur wirtschaftlichen Produktion der 
erfindungsgemalien Proteasen einen kalteangepassten Organismus zu finden, 
der Nukleinsauresequenzen aufweist, die fur kalteangepasste Enzyme in Form 
von spezifischen Proteasen bei niedrigen Prozesstemperaturen (urn 0°C) 
kodieren. Die erfindungsgemafce Losung hierfur ist dem Anspruch 1 zu 
10 entnehmen. Es werden zwei verschiedene Nukleinsauresequenzen aus der 
kalteangepassten Diatomee Fragilariopsis cylindrus beansprucht, von denen 
die eine fur eine Calpain-7-Protease und die andere fur eine Zink- 
Metalloprotease kodiert. Vorteilhafte Weiterbildungen und Anwendungen, die 
sich auch auf die zu den beanspruchten Nukleinsauresequenzen zugehorigen 
15 Polypeptide beziehen, sind den unter- und nebengeordneten Anspruchen zu 
entnehmen. 

Mit der erfindungsgemaSen Losung werden die an die Erfindung gestellten 
Anforderungen optimal erfullt. Zum einen weist der die beanspruchten 

20 Nukleinsauresequenzen aufweisende Organismus spezifische Proteasen in 
Form sowohl eines Calpain-7-Protease-Enzyms als auch eines Zink- 
Metalloprotease-Enzyms auf, zum anderen entstammt der Organismus der 
antarktischen See, sodass diese Enzyme zusatzlich kalteangepasst sind und 
zu ihrer Aktivitat keine Warmezufuhr benotigt wird. Die Kenntnis solcher, die 

25 beanspruchten Nukleinsauresequenzen enthaltenden Gene ist von elementarer 
Wichtigkeit, wenn es z.B. urn die Bereitstellung groBer Mengen solcher 
Nukleinsauresequenzen bei geringem Energieaufwand geht. Die mikrobielle 
Synthese dieser Stoffe erzielt mit der speziellen, schnell wachsenden 
kalteangepassten Kieselalge Fragilariopsis cylindrus unter niedrigen 

30 Temperaturen hohe Ertrage. 
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Durchgefuhrte Sequenzanalysen bestatigen, dass die erfindungsgemad 
beanspruchten Nukleinsauresequenzen fur eine Calpain-7-Protease bzw. eine 
Zink-Metalloprotease kodieren. Durch die heutigen, entwickelten Methoden der 
automatisierten Sequenzierung von Nukleinsaureabschnitten ist es moglich 

5 geworden, in uberschaubaren Zeitraumen gezielt Gene mit gewunschten 
Eigenschaften aus aussichtsreichen Organismen zu isolieren. Umfangreiche 
offentliche Datenbanken mit bereits bestimmten, bekannten Funktionen 
zugeordneten Sequenzen dienen der schnelleren Verifizierung der Ergebnisse 
der muhsamen Suche. Zur Bereitstellung des fur die Sequenzierung 

10 aufbereiteten Grundmaterials aus der speziellen Kieselalge dient eine Reihe 
von an sich bekannten Arbeitsschritten: 

1) Isolation und Kultivierung des Organismus Fragilariopsis cylindrus 

15 Isolation : Wahrend einer Antarktisfahrt mit dem deutschen Forschungseis- 
brecher „Polarstern" in die Weddell-See wurde die Kieselalge Fragilariopsis 
cylindrus aus dem Meereis isoliert. Die Artbestimmung erfolgte in einfacher 
Weise durch die Typisierung der Struktur der Schale (vergleiche 
Veroffentlichung VI von Medlin & Priddle : „Polar marine diatoms", 2 nd edition, 

20 British Antarctic Survey, Cambridge 1990, pp 182, 192). 

Kultivierung : Die Kieselalge wurde bei 0°C in einem nahrsalzangereicherten 
Medium 2 x f/2 bei 10umol Photonen m" 2 s" 1 mit 24h Licht, gehaltert (vergleiche: 
Veroffentlichung VII von Guillard & Ryther : "Studies of marine plancton 

25 diatoms, I.Cyclotella nana (Husted) and Detonula confervacea (Cleve)", 1962, 
Can.J.Microbiol. 8, pp 229:239). FQr eine gesteigerte Expression der fur die 
Kalteanpassung der Art verantwortlichen Gene wurden die Algen in der Mitte 
der exponentiellen Wachstumsphase auf-2°C abgekQhlt. Dies entspricht dem 
Gefrierpunkt von Meerwasser. Nach 5 Tagen wurden die Boten-RNA (mRNA, 

30 messenger RNA) aus den Algen isoliert. Die mRNA reprasentieren alle gerade 
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aktiven Gene, also auch diejenigen, die fur die Kalteanpassung verantwortlich 
sind. 

2) Isolation der mRNA 

Die gesamte RNA wurde mit dem RNAeasy Plant Mini Kit (Firma Qiagen) 
isoliert. Aus ca. 100 \xg RNA konnte mit Hilfe des Oligotex mRNA Midi Kit 
(Firma Qiagen) ca. 800 ng RNA fOr die cDNA-Synthese isoliert werden. 

3) Herstellung und Screening einer cDNA-Bank 

Die cDNA-Bank wurde auf der Basis der mRNA mit dem SMART cDNA-Library 
Construction Kit (Firma Clontech) hergestellt: 

A) Von der mRNA wurde dazu mit Hilfe von Oligonukleotiden und CDS III/3' 
Primern der erste cDNA-Strang synthetisiert. 

B) AnschliefJend wurde die Doppelstrangsynthese mit Hilfe der LD-PCR (long 
distance polymerase chain reaction) im Eppendorf-Thermocycler unter 
folgendem Programm realisiert: 

C) 

1. 5 min Denaturierung bei 95°C, anschlieSend 20 Zyklen von 6 min bei 
68°C und 2 min bei 95°C. 

2. Nach einem SFil-Verdau (mit Restriktionsenzym aus Streptomyces 
fimbriatus) der cDNa wurde sie in CHROMA Spin-400 Saulen der GroBe 
nach fraktioniert, so dass nur cDNAs der Lange >400bp (Basenpaare) 
fur die Klonierung zum Einsatz kamen. 

3. Diese cDNAs wurden uber Nacht bei 16°C in TriplEX2 Vektoren ligiert, 
die von A,-Phagen aufgenommen werden konnten. Der Titer dieser 
cDNA-Bank lag bei 2.7 x 10 9 pfu/ml (plaque forming units / ml). 
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4. Ein Blau-WeiB-Screening mit IPTG (Isopropyl-b-D-Thiogalactosid) und 
X-Gal (X-Galactosid) zeigte eine Rekombinationseffizienz von 70%. 

4) Sequenzanalyse 

5 

Positive Phagen-Plaques wurden vom 5'-Ende mit ^-Primern vom Qiagen- 
Sequencing-Service sequenziert. Die Sequenzen wurden in der Genbank bei 
NCBI (National Center for Biotechnology Information) mit der BLASTX-Option 
auf ihre Homologien zu vorhandenen Sequenzen untersucht (BLAST-Protokoll 
10 vom 14.12.2001, Calpain-7-Protease; BLAST-Protokoll vom 24.04.2002, Zink- 
Metalloprotease). FOr die Calpain-7-Protease konnte aus ca. 400 Sequenzen 
eine homologe Sequenz, fur die Zink-Metalloprotease mindestens eine 
homologe Sequenz gefunden werden. 

15 In Figur 1 ist das Ergebnis einer phylogenetischen Analyse fur die Calpain-7- 
Protease aus der Diatomee Fragilariopsis cylindrus dargestellt. Sie gruppiert 
mit signifikantem bootstrap support (allgemein bekannte mathematisch- 
statistische Methode) von 99% mit anderen Calpain-7-Proteasen. In Figur 2 ist 
das Ergebnis einer phylogenetischen Analyse fur die Zink-Metalloprotease aus 

20 Fragilariopsis cylindrus dargestellt. Sie gruppiert mit signifikantem bootstrap 
support von 99% mit anderen Zink-Metalloproteasen. 

Es handelt sich daher bei den kalteangepassten Enzymen, die von den 
beanspruchten Nukleinsauresequenzen nach der Erfindung aus der Diatomee 
25 Fragilariopsis cylindrus kodiert werden, mit einer Sicherheit von 99% ebenfalls 
urn eine Calpain-7-Protease bzw. urn eine Zink-Metalloprotease. 
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Patentanspruche 

1. Fur proteinspaltende Enzyme in Form von speziellen Proteasen kodierende 
s Nukleinsauresequenzen, 

dadurch gekennzeichnet, dass 

die Nukleinsauresequenzen aus der kalteangepassten marinen Diatomee 
Fragilariopsis cylindrus stammen und fur eine Calpain-7-Protease gemafc 
SEQ ID No.1 und fur eine Zink-Metalloprotease gemaB SEQ ID No.2 oder fur 
10 funktionelle Varianten beider Proteasen kodieren oder als Abschnitte mit 
mindestens 8 Nukleotiden davon ausgebildet sind. 

2. Nukleinsauresequenzen nach Anspruch 1, 
dadurch gekennzeichnet, dass 

15 die Nukleinsauresequenzen als DNA oder RNA, vorzugsweise als 
doppelstrangige DNA ausgebildet sind. 

3. Nukleinsauresequenzen nach Anspruch 1 oder 2 
dadurch gekennzeichnet, dass 

20 die Nukleinsauresequenzen in Vektoren, vorzugsweise in Expressionsvektoren 
enthalten sind. 

4. Verwendung der Nukleinsauresequenzen nach Anspruch 3 zur Expression 
oder Oberexpression der Enzyme Calpain-7-Protease und/oder Zink- 

25 Metalloprotease in Wirtsorganismen. 

5. Zu den Nukleinsauresequenzen gemaB Anspruch 1 oder 2 geherige 
Polypeptide, die aus mit den Nukleinsauresequenzen gemaiS SEQ ID No. 1 und 
SEQ ID No.2 kodierten Aminosauresequenzen, als funktionelle Varianten 

30 davon oder als Abschnitte mit mindestens 6 Aminosauren davon bestehen. 
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6. Verwendung der Enzyme Calpain-7-Protease und Zink-Metalloprotease 
nach Anspruch 1 zu Therapiezwecken 

7. Verwendung der Enzyme Calpain-7-Protease und Zink-Metalloprotease 
5 nach Anspruch 1 zu Reinigungszwecken bei proteinhaltigen Verschmutzungen. 

8. Verwendung der Polypeptide nach Anspruch 5 zu Therapiezwecken. 

9. Verwendung der Polypeptide nach Anspruch 5 zu Reinigungszwecken bei 
10 proteinhaltigen Verschmutzungen. 



15 
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Sequenzprotokoll 



<110>Stiftung Alf r ed- Wegener- Ins ti tut fur Polar- und Meeresf orschung, 
Bremerhaven 

5 

<120>Fur eine Calpain-Protease kodierende neue Nukleinsauresequenz aus 
einer kalteangepassten marinen Diatomee Fragilariopsis cylindrus 

<130>AWI 01/0902 DE 

10 

<160>2 

<210>1 
<211>544 
15 <212>DNA 

<213>Fragilariopsis cylindrus 

<400>1 

20 GG GAA TTC GGC CTT ACG GCC GGG GAT GAT GGA ATG TTC TGG ATT AGT 4 7 

Glu Phe Gly Leu Thr Ala Gly Asp Asp Gly Met Phe Trp He Ser 
1 5 .10 15 

TGG GAG GAT GTC TTG CTT TAT TTC CGC AAT TTA CAA TTA TCA TGG AAT 95 
25 Trp Glu Asp Val Leu Leu Tyr Phe Arg Asn Leu Gin Leu Ser Trp Asn 

20 25 30 

CCC AAA CTA TTT GCG TAT CGG ATG ACT ACT CAT GGC TTA TGG CCA AAG 14 3 

Pro Lys Leu Phe Ala Tyr Arg Met Thr Thr His Gly Leu Trp Pro Lys 
30 35 40 45 

GAT CAG GGA CCA CAA AAT GAT GCA TTT AAT GTC GGA GAG AAT CCA CAA 191 
Asp Gin Gly Pro Gin Asn Asp Ala Phe Asn Val Gly Glu Asn Pro Gin 
50 55 60 

35 

TAT ATC ATG TCT TTC TCC GAA AAA GCT GTA TCG AGT AAA CCA ACG ATT 239 
Tyr He Met Ser Phe Ser Glu Lys Ala Val Ser Ser Lys Pro Thr He 
65 70 75 

40 TGG GTA CTG ATA TCA AGG CAT GTA AGC AAA CAG GAG CAA GAA GGT GCT 287 
Trp Val Leu He Ser Arg His Val Ser Lys Gin Glu Gin Glu Gly Ala 
80 85 90 95 

GAG GTG AAT GAT TTC TTA ACC ATA CAT CTC GTT AGA AAC TCG GCT ACA 335 
45 Glu Val Asn Asp Phe Leu Thr He His Leu Val Arg Asn Ser Ala Thr 

100 105 110 

TTA GAA AGA GTT TGG TAT CCC CAT GGA AAA GCA ACG ATT GCT AAT GGA 383 
Leu Glu Arg Val Trp Tyr Pro His Gly Lys Ala Thr He Ala Asn Gly 
50 115 120 125 

TGC TAT ACA AAC AAT CCA CAC GTG CTT TTA CGA TAC GAT GTT TCC GGA 431 

Cys Tyr Thr Asn Asn Pro His Val Leu Leu Arg Tyr Asp Val Ser Gly 

130 135 " 140 

55 

CCT GAA GAT CAA TTT ATC TCG TTA GTA CTG TCT CAA CAC GAA AAA ACT 479 

Pro Glu Asp Gin Phe He Ser Leu Val Leu Ser Gin His Glu Lys Thr 

145 150 155 

60 CAA GAT CTA TCA TAC ACT CTC TCT TGT TAC TGT ACC GAA CCC TTT ACA 527 
Gin Asp Leu Ser Tyr Thr Leu Ser Cys Tyr Cys Thr Glu Pro Phe Thr 
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160 165 170 175 

CTA GGA AGA CCA CCA AA 544 
Leu Gly Arg Pro Pro 
5 180 

<210>2 

<211>544 

<212>DNA 

10 <213>Fragilariopsis cylindrus 
<400>2 

TCA AAC GAT GGT GCG CAA TAC GTA GTA GAG AAA TCG ATA CTG GTA GGT 48 
15 Ser Asn Asp Gly Ala Gin Tyr Val Val Glu Lys Ser lie Leu Val Gly 
1-5 10 15 

TCA GTG AAT TAT CCT GTA AAA GAT CCA TTT AAT CAG ATG AAA CGT GGA 96 
Ser Val Asn Tyr Pro Val Lys Asp Pro Phe Asn Gin Met Lys Arg Gly 
20 20 25 30 

TCA CTT CAA ACC TAC TCA GAT TCA TGG ACC GAA CGG GAT CGT ACC TCA 14 4 

Ser Leu Gin Thr Tyr Ser Asp Ser Trp Thr Glu Arg Asp Arg Thr Ser 
35 40 45 

25 

TTT GTC ATG GCA TCA CGT AAC TTA GCC GAT TTT CGT AAT AAC GTG AAG 192 

Phe Val Met Ala Ser Arg Asn Leu Ala Asp Phe Arg Asn Asn Val Lys 
50 55 60 

30 GTA ACG ATC GAT GCT GTT TTT AAT CCA CTT TTT ATC AAC GAG GAA TAC 24 0 
Val Thr lie Asp Ala Val Phe Asn Pro Leu Phe He Asn Glu Glu Tyr 
65 70 75 80 

AAA TGG ATC TTT CGT CAA GAA GGC TGG AGG TTA GAG ACA CCT GAC AAT 288 
35 Lys Trp He Phe Arg Gin Glu Gly Trp Arg Leu Glu Thr Pro Asp Asn 

85 90 95 

GTC AAC CTA CTT ATC AAT GGG AAC GCT TAT GTA AAC GCT AAG GCC GAC 336 
Val Asn Leu Leu He Asn Gly Asn Ala Tyr Val Asn Ala Lys Ala Asp 
40 100 105 110 

CAG ATG GAC CCC CAA GAG GTT ATG ATA AAG CAA ATC TAC AGC AAT CTC 384 
Gin Met Asp Pro Gin Glu Val Met He Lys Gin He Tyr Ser Asn Leu 
115 120 125 



45 



TTT GCT GAT CAC GTG TAT AGC AAA AGT CCA AAA GGA GAC GCC GCC CAA 432 
Phe Ala Asp His Val Tyr Ser Lys Ser Pro Lys Gly Asp Ala Ala Gin 
130 135 140 



50 GTA GTC ACC ATG ACA TTG GCA CCA AGG GCG AAT TCT GCA GAT ATC CAT 4 80 
Val Val Thr Met Thr Leu Ala Pro Arg Ala Asn Ser Ala Asp He His 
145 150 155 160 

CAC ACT GGC GGC CGT CTC GAG CAT GCA TCT AGA GGG CCC AAT TCG CCC 528 
55 His Thr Gly Gly Arg Leu Glu His Ala Ser Arg Gly Pro Asn Ser Pro 

165 170 175 

TAT AGT GAG TCG TAT T 54 4 

Tyr Ser Glu Ser Tyr 
60 180 181 



